|
(略称:CSV)は、いくつかのフィールド(項目)をカンマ「 , 」で区切ったテキストデータおよびテキストファイル。拡張子は .csv 、MIMEタイプは text/csv 。「」とも言う。広く普及した訳語はないが、「カンマ区切り」などとも呼ばれる。Microsoft Excelでは「CSV (カンマ区切り)」としている。 データ交換用のデファクトスタンダードとして、古くから多くの表計算ソフトやデータベースソフトで使われているが、細部の実装はソフトによって異なる。それらを追認する形で、2005年10月、RFC 4180 で (IESGの外部で決定された有用な情報の提供)として仕様が成文化された。 類似したフォーマットとして、タブ区切りされた (TSV)や、半角スペース区切りされた (SSV) などがあり、これらをまとめて (CSV)、 とも呼ばれることも多い。 == 仕様 == RFC 4180に述べられた仕様について述べる。 ファイルは1つ以上のレコードからなる。レコードは改行(CRLF、U+000D U+000A)で区切られる。最後のレコードの後には改行はあってもなくてもいい。 レコードは1つ以上の同じ個数のフィールドからなる。フィールドはコンマ「,」(U+002C) で区切られる。最後のフィールドの後にはコンマは付けない。 (以下の例では、読みやすさのためにCRLFの前にスペースを書くが、実際はないものと思って読んで欲しい) 日本国,東京,127767944 CRLF アメリカ合衆国,ワシントン,300007997 CRLF … なお、最後のフィールドの後にはコンマはないので、もしレコードがコンマで終わっているように見えれば、実際はその後に空文字列(長さ0の文字列)からなるフィールドがある。次のレコードは、「日本国」「東京」「」の3つのフィールドからなる。 日本国,東京, CRLF ファイルの先頭には、オプションとして、通常のレコードと同一の書式の「ヘッダ行」があってもいい。ヘッダ行は、他のレコードと同じ個数のフィールドを持ち、フィールドの名称が書かれている。 国,首都,人口(2006) CRLF 日本国,東京,127767944 CRLF アメリカ合衆国,ワシントン,300007997 CRLF … フィールドは、ダブルクォート「"」(U+0022) で囲んでも囲まなくてもよい。次の3つのレコードは、(文字列としては)同じ内容である。(ただし、RFCはフィールドの解釈までは規定していない。一部のソフトはダブルクォートで囲まれているかどうかで解釈を変える) 日本国,東京,127767944 CRLF "日本国","東京","127767944" CRLF "日本国","東京",127767944 CRLF フィールドがコンマ、ダブルクォート、改行を含む場合は、かならずダブルクォートで囲む。また、フィールドに含まれるダブルクォートは2つ並べてエスケープする。次のレコードの内容は、「日本国」「"東京"」「127,767,944」である。なお、ここでいう「コンマ」「ダブルクォート」はU+002CとU+0022のことで、他のもの(たとえば全角コンマ)は関係ない。ただし、「改行」にはCR (U+000D) とLF (U+000A) を含む。 "日本 CRLF 国","""東京""","127,767,944" CRLF 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Comma-Separated Values」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Comma-separated values 」があります。 スポンサード リンク
|